A Mudança para Modelos Treinados por Instruções
Qual é a Base?
No passado, os modelos base de LLM foram treinados principalmente para prever a próxima palavra em uma sequência com base em grandes quantidades de dados. No entanto, para desenvolvedores, o verdadeiro poder reside em modelos de LLM treinados por instruções. Esses modelos são refinados usando Aprendizado por Reforço a partir de Feedback Humano (RLHF) para seguir comandos específicos e atuar como assistentes úteis.
A Regra de Ouro:Trate o LLM como um estagiário inteligente, mas literal. Ele não possui o seu contexto específico, então você deve ser explícito sobre seus objetivos.
Como Aplicar os Princípios Fundamentais
- Clareza e Especificidade: Clareza não significa brevidade. Fornecer mais contexto e usar delimitadores (como crases triplas ou tags XML) ajuda o modelo a distinguir suas instruções dos dados que ele precisa processar.
- Dê ao Modelo Tempo para Pensar: Tarefas complexas exigem um raciocínio em cadeia. Se pedir ao modelo para saltar diretamente para uma conclusão, é mais provável que cometa um erro de raciocínio. Instrua-o a resolver sua própria solução primeiro.
Evite Alucinações
Os modelos podem gerar informações "plausíveis" mas falsas. Sempre verifique os fatos ou instrua o modelo a citar suas fontes para mitigar esse risco.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"